IA024
ROCm e HIP: Una Guía Detallada de 10 Capítulos
Ingeniería de Rendimiento en GPUs de AMD
Objetivos de Aprendizaje
- Identificar cuellos de botella arquitectónicos utilizando Omniperf y ROCProfiler.
- Optimizar los patrones de acceso a memoria para maximizar el rendimiento de HBM2e/HBM3.
- Comprender la programación de ondas y la ocupación en la Unidad de Cálculo CDNA.
- Implementar optimizaciones a nivel de instrucción para núcleos vectoriales y matriciales.